當我們談論人工智慧時,常把焦點放在模型架構、參數量,或是「誰的基準數字更高」。但在 2020 年代中段之後,賽場的真正分水嶺逐漸轉向「如何更高效、更大規模地把模型變成可用的服務」——也就是訓練與推論在成本、速度、能耗與能否商業化之間的平衡。
2025 年 Google 在 Cloud Next 上推出第七代 TPU「Ironwood」,不是單純的軍備競賽,而是一項系統性策略:把記憶體、互聯、能效、與可擴展性當作下一代 AI 服務的核心指標,向外界展示其不只要有算力,還要讓算力變得可用與可負擔。筆者透過 AIMochi 筆記工具,來看看 Google 所推出的第七代 TPU「Ironwood」!
要理解 Ironwood 的意義,得回頭看 Google 投資自研晶片的脈絡。TPU 系列從早期的訓練加速器,逐步演化為今日既能訓練也能推論、並可在雲端提供給外部客戶的專用硬體。
自研晶片的優勢並非只是「效能更高」:它允許軟體與硬體協同最佳化(co-design),能為自家服務(Google Search、YouTube、Gemini 等)量身打造運算、記憶體與散熱解法;同時,對外銷售或雲端租用也形成差異化競爭力。
Ironwood 標誌著 Google 在這條路上,把「推論」放在核心位置——這與以往以訓練為主的設計重心形成明顯轉折。
專為推論設計:Ironwood 是 Google 指出「第一款專為推論(inference)而設計」的 TPU。推論導向意味著設計會特別考量延遲(latency)、記憶體頻寬、以及在持續運行下的能耗效率,目標是讓大型生成式模型能在實務場景中更低成本、低延遲地提供回應。
單晶片峰值與整體 Pod 容量:Ironwood 在整體可擴展配置中,單一大型 Pod 可達到數十 ExaFLOPS 級別(Google 公布的 42.5 ExaFLOPS 為示例標的),並且支援從較小(256 晶片)到極大(9,216 晶片)的 Pod 佈局,給予客戶彈性選擇。這個數字提示的是「在雲端上能租到的即時推論超級電腦」。
高頻寬記憶體(HBM)大幅升級:每顆 Ironwood 晶片配備顯著放大的 HBM 容量(Google 提及相較前代增加數倍,TechNews 援引數據指出每顆可達 192GB 等級),這對於需要處理巨量模型參數或長上下文(long context)的生成式模型至關重要:更多 HBM 等於更少頻繁跨層傳輸,進而降低延遲與能耗。
能效表現:官方宣稱 Ironwood 的能效(performance-per-watt)較前代 Trillium 提升約 4 倍,這在能源成本與資料中心供電受限的情境下極具商業意義。換言之,單位電費能買到更多推論次數,直接影響雲端服務的價格與利潤空間。
Ironwood 不只是「單顆晶片更強」。Google 同步展示了整套系統設計思維:晶片間的高速互聯(避免頻繁跨節點的大量資料移動)、以及與液冷系統整合以提高持續作業時的熱管理效率。
這種端到端的設計能降低因熱節制而短暫降低頻率的情況,讓長時間、大負載的推論工作保持穩定效能。Pod 設計上的尺度化,意味著 Google 能在不同客戶需求間彈性配置(從中型服務到大規模模型訓練/推論),也可視為其雲端商業化策略的一部分。
對 Google 本身:Ironwood 直接支援其 Gemini 系列模型與內部服務,提升使用體驗與降低營運成本,並把 Google Cloud 的差異化賣點從「軟體整合」延伸到「硬體供應」。
對雲端客戶(包括 LLM 業者):像 Anthropic 等初期客戶可藉由 Ironwood 的推論效能,降低模型營運成本、提升延遲體驗、或擴展更多即時應用場景(如語音/視覺即時回應服務)。多家媒體報導表示 Google 將在未來數週內提供 Ironwood 的 public access,代表外部客戶能更容易取得這類高效硬體資源。
對 Nvidia 及整體 AI 硬體市場:長期以來,Nvidia 的 GPU 是大多數雲端與訓練/推論工作負載的首選。Ironwood 的推出,特別在推論與大規模 Pod 佈局上,將成為直接競爭者;但競爭不只是算力:包含生態系統(軟體工具鏈、開發者熟悉度)、合作夥伴(如代工與供應鏈夥伴),以及定價/合約模式,都是競爭的關鍵。
Ironwood 的推出象徵著 AI 硬體競賽進入「系統與商業化」的新階段:硬體不再只是跑分工具,而是要把大模型變成可持續、可量化、可商業化的服務。
Google 把「推論」擺在核心,並以更大的 HBM、能效改進、以及可擴展 Pod 架構去滿足生成式模型爆炸式的即時運算需求。然而,硬體只是棋盤上的一子,生態、價格、供應鏈、以及跨雲策略,才是決定最終勝負的變數。
對於關注 AI 商業化、資料中心策略或半導體供應鏈的人來說,Ironwood 值得被視為一個新的起點——也是下一輪戰役的序幕。
以上資訊僅供分享與參考之用,請自行保留獨立判斷。若想快速了解更多資訊,善用 AIMochi 筆記工具,幫我們從海量資料中,梳理出關鍵資訊,讓我們精準掌握重要訊息!